本研究提出了一种使用深入学习工作流程来量化建筑环境中的损坏的新方法来量化。由于自动履带,从谷歌地球获得了全世界50个震中的自然灾害前后的空中图像,从谷歌地球获得了一台10,000个空中图像数据库,每像素的空间分辨率为2米。该研究利用算法SEG-Net在两个实例(现有和后自然灾害)中的卫星图像中的建筑环境的语义分割。对于图像分割,SEG-Net是最受欢迎和最通用的CNN架构之一。 SEG-NET算法在分割中达到了92%的精度。分割后,我们将两种情况之间的差异与变化百分比进行了比较。这种变化系数代表了数控的损坏,城市环境必须量化建筑环境中的整体损坏。这样的指数可以让政府估计受影响家庭的数量,也许是住房损害的程度。
translated by 谷歌翻译
本文介绍了一个数据集,用于培训和评估方法,以估算由标准RGB摄像机捕获的任务演示中手持工具的6D姿势。尽管6D姿势估计方法取得了重大进展,但它们的性能通常受到严重遮挡的对象的限制,这在模仿学习中是一个常见的情况,而操纵手通常会部分遮住对象。当前,缺乏数据集可以使这些条件的稳健6D姿势估计方法开发。为了克服这个问题,我们收集了一个新的数据集(IMITROB),该数据集针对模仿学习和其他人类持有工具并执行任务的其他应用中的6D姿势估计。该数据集包含三个不同工具和六个操纵任务的图像序列,这些任务具有两个相机观点,四个人类受试者和左/右手。每个图像都伴随着由HTC Vive运动跟踪设备获得的6D对象姿势的准确地面真相测量。通过训练和评估各种设置中的最新6D对象估计方法(DOPE)来证明数据集的使用。数据集和代码可在http://imitrob.ciirc.cvut.cz/imitrobdataset.php上公开获得。
translated by 谷歌翻译
在过去的几年中,多模式变异自动编码器(VAE)一直是一项激烈研究的主题,因为它们可以将多种模态整合到联合表示中,因此可以作为数据分类和生成的有前途的工具。到目前为止,已经提出了几种多模式VAE学习的方法,但是它们的比较和评估相当不一致。原因之一是模型在实现级别上有所不同,另一个问题是,在这些情况下常用的数据集最初不是为评估多模式生成模型的设计。本文解决了这两个问题。首先,我们提出了一个用于系统多模式VAE训练和比较的工具包。其次,我们提出了一个合成的双峰数据集,旨在全面评估联合发电和交叉生成能力。我们通过比较最新模型来证明数据集的实用性。
translated by 谷歌翻译
最小的侵入性手术是高度操作员,依赖于冗长的程序时间,导致患者疲劳和风险。为了减轻这些风险,实时系统可以通过提供对场景的清晰了解并避免在操作过程中避免错误估计来帮助外科医生导航和跟踪工具。尽管已经朝这个方向做出了几项努力,但缺乏不同的数据集,并且非常动态的场景及其在每个患者中的可变性都需要实现强大的系统的重大障碍。在这项工作中,我们对最新基于机器学习的方法进行了系统评价,包括手术工具定位,细分,跟踪和3D场景感知。此外,我们提出了这些发明方法的当前差距和方向,并在这些方法的临床整合背后提供了合理的理性。
translated by 谷歌翻译
机器学习和临床研究社区利用现实世界数据(RWD)的方法,包括电子健康记录中捕获的数据(EHR)截然不同。虽然临床研究人员谨慎使用RWD进行临床研究,但用于医疗团队的ML会消费公共数据集,并以最少的审查来开发新算法。这项研究通过开发和验证ML-DQA来弥合这一差距,ML-DQA是基于RWD最佳实践的数据质量保证框架。 ML-DQA框架适用于两个地理位置的五个ML项目,分别是不同的医疗状况和不同的人群。在这五个项目中,共收集了247,536名患者的RWD,共有2,999项质量检查和24份质量报告。出现了五种可推广的实践:所有项目都使用类似的方法来分组冗余数据元素表示;所有项目都使用自动实用程序来构建诊断和药物数据元素;所有项目都使用了一个共同的基于规则的转换库;所有项目都使用统一的方法将数据质量检查分配给数据元素;所有项目都使用类似的临床裁决方法。包括临床医生,数据科学家和受训者在内的平均有5.8个人参与每个项目实施ML-DQA,每个项目平均进行了23.4个数据元素。这项研究证明了ML-DQA在医疗项目中的重要性作用,并为团队提供了开展这些基本活动的框架。
translated by 谷歌翻译
多目标算法的性能随问题而变化,因此很难开发新算法或将现有的算法应用于新问题。为了简化新的多目标算法的开发和应用,对组件零件的自动设计产生了越来越多的兴趣。这些自动设计的元启发式学可以胜过其人类开发的对应物。但是,仍然不确定什么是导致其性能提高的最有影响力的组成部分。这项研究介绍了一种新方法,以研究自动设计算法的最终配置的影响。我们将此方法应用于基于IRACE软件包设计的分解(MOEA/D)的表现良好的多物镜进化算法,该算法是在9个受约束问题上设计的。然后,我们将算法组件的搜索轨迹网络(STN),人群的多样性和HyperVolume的影响对比。我们的结果表明,最有影响力的组件是重新启动和更新策略,性能和更明显的度量值的增长更高。同样,它们的相对影响取决于问题的难度:在MOEA/D表现更好的问题中,不使用重新启动策略更具影响力;尽管更新策略在MOEA/D执行最差的问题中更具影响力。
translated by 谷歌翻译
人工智能(AI)对计算的巨大需求正在推动对AI的硬件和软件系统的无与伦比的投资。这导致了专用硬件设备数量的爆炸,现在由主要的云供应商提供。通过通过基于张量的界面隐藏低级复杂性,张量计算运行时间(TCR)(例如Pytorch)允许数据科学家有效利用新硬件提供的令人兴奋的功能。在本文中,我们探讨了数据库管理系统如何在AI空间中乘坐创新浪潮。我们设计,构建和评估张量查询处理器(TQP):TQP将SQL查询转换为张量程序,并在TCR上执行它们。 TQP能够通过在张量例程中实现与关系运算符的新颖算法来运行完整的TPC-H基准。同时,TQP可以支持各种硬件,而仅需要通常的开发工作。实验表明,与专用CPU和仅GPU的系统相比,TQP可以将查询执行时间提高到10美元$ \ times $。最后,TQP可以加速查询ML预测和SQL端到端,并在CPU基线上输送高达9 $ \ times $速度。
translated by 谷歌翻译
了解多目标进化算法(MOEAS)的搜索动力学仍然是一个开放的问题。本文扩展了最新的基于网络的工具,即搜索轨迹网络(STNS),以模拟MOEAS的行为。我们的方法使用分解的想法,其中多物原理问题转化为几个单目标问题。我们证明,使用10个连续的基准问题和3个目标,可以使用STN来模拟和区分两种流行的多目标算法MOEA/D和NSGA-II的搜索行为。我们的发现表明,我们可以使用STN进行算法分析来提高对MOEAS的理解。
translated by 谷歌翻译
生物重建VII轨道3挑战重点是在Twitter用户时间表中识别药物名称。对于我们提交这一挑战,我们通过使用多种数据增强技术扩展了可用的培训数据。然后,增强数据用于微调在一般域推特内容上预先培训的语言模型的集合。拟议的方法优于先前的最先进的算法Kusuri,并在竞争中排名高,为我们所选择的客观函数重叠F1分数。
translated by 谷歌翻译
最近的深层摄影的出现使操纵和生成的内容成为机器学习研究的最前沿。自动检测深击已经看到了许多新的机器学习技术,但是,人类的检测功能的探索功能要少得多。在本文中,我们介绍了比较人类和机器检测用于模仿某人声音的音频深击的能力的结果。为此,我们使用基于Web的应用程序框架作为游戏。要求参与者区分真实和假音频样本。在我们的实验中,有378位唯一用户与最先进的AI DeepFake检测算法竞争,以12540的比赛总数。我们发现,人类和深层检测算法具有相似的优势和劣势,都在努力检测某些类型的攻击。这与许多应用领域(例如对象检测或面部识别)中AI的超人性能形成对比。关于人类的成功因素,我们发现IT专业人员没有非专业人士的优势,但母语人士比非本地人的人具有优势。此外,我们发现年长的参与者往往比年轻的参与者更容易受到影响。在为人类设计未来的网络安全培训以及开发更好的检测算法时,这些见解可能会有所帮助。
translated by 谷歌翻译